Posted on 15 September 2014
Les Archives historiques de l’Union européenne ont achevé leur tout premier projet d'archivage de contenu Web. A l’issue de ce projet pilote mené en collaboration avec la Fondation Internet Memory, les Archives historiques ont abouti à des conclusions et des recommandations précieuses pour le développement d’une stratégie de l’archivage du Web des institutions européennes.
« Les Archives historiques reconnaissent qu'Internet est une mine d'informations en évolution constante et à risque de disparition, et c’est pourquoi nous avons lancé un projet pilote d'archivage du contenu Web des sites des institutions de l'Union européenne», explique Dieter Schlenker, Directeur des Archives historiques.
Dans ce projet pilote, les contenus des sites web des institutions européennes ont été collectés grâce à ce que l’on appelle un robot d’indexation. A partir des données d'URL, ce logiciel traite les sites Web et en stocke le contenu dans un format d'archivage standard international. Ce projet se poursuit au cours de l’année 2014 avec deux vagues de collecte et indexation des sites Web de toutes les institutions de l’UE, l’une est en cours quant à l’autre, elle aura lieu en novembre. Jusqu’ici et au terme de la première indexation et de son évaluation, la solution d’open source qui a été utilisée dans le cadre des institutions de l'UE a produit des résultats à la fois satisfaisants et encourageants. Ces derniers seront utilisés pour évaluer le projet et élaborer la future stratégie.
Grâce à ce projet pilote les Archives historiques, par leur expérience pratique et les cas concrets, aident le Groupe de Travail institutionnel sur la préservation du Web de l’UE coordonné par l’Office des publications, à évaluer l’activité d’archivage Web ainsi qu’à fournir des recommandations aux organes de décision de l’Union européenne.
Les Archives historiques, conjointement avec la Fondation Internet Memory, ont mis à disposition une plate-forme d’accès publique à ces archives. Une fois pleinement opérationnelle, l'exercice d'archivage du Web sera également étendu aux différentes agences de l'UE et élèvera jusqu’à quatre le nombre des instantanés complets d’indexation par an.
Les raisons pour préserver les sites Web sont nombreuses. L'archivage du Web assure l'accès au contenu numérique créé comme communications des organisations officielles et publiques tout en saisissant l'identité visuelle corporative. L’intérêt est aussi de fournir des preuves de moments spécifiques de la vie des institutions européennes. En ce sens, l'équipe chargée du projet étudie également afin de compléter les collections passées grâce à la collaboration avec l'organisation Internet Archive de San Francisco aux Etats-Unis, qui a archivé les sites des institutions européennes pendant plus d'une décennie.
Site Web: http://collections.internetmemory.org/haeu
Contact des Archives historiques: [email protected]
Contact du Groupe de Travail de l’UE sur la Préservation Web: [email protected]